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点 蜂 缘 晨 触角 转录 组 及 化 学 感受 相关 基因 的 分 析 


RAF, BAR, RAKE, WRA, TAR” 


(河南 科技 大 学 林学 院 , 河南 洛阳 471000) 


摘要 :【 目 的 】] 点 蜂 缘 晴 Riptortus pedestris 主要 为 BR fo 2 KR RC IR ,造成 严重 损失 
目前 对 该 虫 的 研究 较 少 ,基因 信息 缺乏 。 本 研究 旨 在 获得 ， SABIE Se Ri AER ILMB, FIR PR 
党 防治 害 下 的 新 方法 。【 方法】 利用 Humina Hiss" 4000 高 通 量 测序 技术 测定 了 点 蜂 缘 暑 成 虫 触 

角 转 录 组 ,并 进行 了 生物 学 信息 分 析 。 【结果 】 共 获得 45 802 812 条 clean reads, 包括 6. 87 Gb 

(GenBank 登录 号 : SRR4429103 ) 。 拼 接 92 259 £ 条 unigenes ,平均 长 度 为 618 bp, N50 为 1 013 bp, 

在 7 大 数据 库 中 注释 到 21 365 条 unigenes。 通 过 进一步 转录 组 数据 分 析 , 我 们 鉴定 出 219 个 点 蜂 

缘 蝴 化 学 感受 相关 基因 ,包括 188 个 嗅觉 受 体 .6 个 味觉 受 体 、2 个 离子 型 受 体 4 个 感觉 神经 元 膜 

蛋白 .8 个 气味 结合 蛋白 和 11 个 化 学 感受 蛋白 。 和 氨基 酸 序列 分 析 发 现 ,RpedOBP1 和 RpedOBP2 在 

第 6 个 保守 的 半 胱 氢 酸 后 又 多 了 3 个 保守 的 半 胱 氢 酸 位 点 ,属于 加 Plus-C 气味 结 

【结论 ] 本 研究 获得 了 点 蜂 缘 晴 触 角 转 录 组 数据 ,并 鉴定 出 嗅觉 相关 基因 ,结果 为 今后 利用 嗅觉 

因 切 标 防治 点 蜂 缘 赌 提 供 了 重要 的 分 子 生物 学 信息 数据 。 

关键 词 : REAM; 触角 转录 组 ; 高 通 量 测序 ; 基因 注释 ; 化 学 感受 相关 基因 
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Analysis of the antennal transcriptome and chemoreception-related genes 





of the bean bug, Riptortus pedestris ( Hemiptera: Alydidae) 

SONG Yue-Qin, DONG Jun-Feng, CHEN Qing-Xiao, HU Zhen-Jie, SUN Hui-Zhong” ( Forestry 
College, Henan University of Science and Technology, Luoyang, Henan 471000, China) 

Abstract: [ Aim) Riptortus pedestris is a major soybean pest which feeds juice in the stages of adult and 
nymph, causing serious damage to production. However, R. pedestris has been rarely researched, that 
leads to the lack of genomic resources. The objective of this study is to obtain the antennal transcriptome 
data of R. pedestris and to seek new methods for pest control through olfaction. [Methods] The adult 
antennal transcriptome of R. pedestris is sequenced using Illumina HiSeq™ 4000 platform and analyzed 
bioinformatically. [Results] In total, 45 802 812 clean reads with 6. 87 Gb were obtained ( GenBank 
accession no. : SRR4429103). There were 92 259 unigenes with the mean length of 618 bp and an N50 
of 1 013 bp. A total of 21 365 unigenes were annotated based on seven databases. By further analyzing 
the transcriptome data, we identified 219 chemoreception-related genes including 188 for olfactory 
receptors (ORs), 6 for gustatory receptors ( GRs) , 2 for ionotropic receptors (IRs), 4 for sensory 
neuron membrane proteins (SNMPs) , 8 for odorant-binding proteins ( OBPs) and 11 for chemosensory 
proteins ( CSPs). The analysis of amino acid sequence indicated that RpedOBP1 and RpedOBP2 have 
three additional conserved cysteine residues immediately after the sixth cysteine and belong to the plus-C 


OBP family. [ Conclusion] This study acquired the antennal transcriptom data of R. pedestris and 
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identified olfaction-related genes. The results provide the important information data of molecular biology 


for the control of R. pedestris using olfaction-related gene targets. 


Key words: Riptortus pedestris; antennal transcriptome; high-throughput sequencing; gene annotation; 


chemoreception-related genes 


化 学 感受 系统 在 昆虫 的 整个 生命 周期 中 起 着 至 
关 重 要 的 作用 ,包括 取 食 定位、 躲避 天 敌 、 交 配 、 寻 
找 适 合 的 寄主 、 产 卵 位 置 的 选择 等 等 ( Birkett et al., 
2004; Kurtovic et al., 2007; Becher et al., 2012) , 而 
触角 是 这 一 化 学 感受 系统 中 的 主要 嗅觉 器 官 , 它 通 
过 复杂 的 生物 化 学 反应 来 确保 化 学 信号 的 精确 传导 
( Vogt et al., 1985; Ozaki et al., 2005; Vosshall and 
Stocker, 2007; Benton et al., 2009)。 触 角 外 周 嗅 觉 
系统 中 参与 化 学 传导 过 程 的 蛋白 质 主 要 有 气味 结合 
蛋白 ( odorant-binding proteins, OBPs) ( Vogt and 
Riddiford, 1981) , fk 2 J&& AZ 4E H ( chemosensory 
proteins, CSPs) (Pelosi et al., 2014) , Wi qr Az p 
(olfactory receptors, ORs) (Clyne et al., 1999) 味觉 
受 体 ( gustatory receptors, GRs) ( Clyne et al., 2000) , 
离子 型 受 体 (ionotropic receptors, IRs) ( Benton et 
al., 2009 ) 和 嗅觉 神经 元 膜 蛋 白 (sensory neuron 
membrane proteins, SNMPs) ( Benton et al., 2007) 
等 ,这 些 蛋 白 都 可 能 成 为 未 来 无 公害 害虫 防治 的 淤 
TE SE ER ( Plettner, 2002) 。 

OBPs 和 CSPs 都 是 小 分 子 量 的 可 溶性 和 蛋白质 ， 
能 结合 外 界 环境 中 的 气味 ,然后 通过 感 器 中 的 淋巴 
液 将 气味 分 子 传递 到 嗅觉 神经 原 的 膜 表 面 ,完成 嗅 
觉 传 导 的 第 一 步 ( Vogt et al., 1985) 。OBPs 根据 序 
列 中 半 胱 氨 酸 的 数量 ,分 为 3 类 :1) 典 型 OBPs, 具 有 
6 个 保守 的 半 胱 胺 酸 位 点 (Sun et al., 2016); 
2) Minus-C OBPs, 半 胱 氨 酸 数量 少 于 6 个 (Gong et 
al., 2009) ;3) Plus-C OBPs ,具有 6 个 以 上 的 保守 半 
胱 氨 酸 位 点 (Gu et al., 2011) 。CSPs 最 早 被 发 现在 
黑 腹 果 晶 Drosophila melanogaster 的 触角 中 ,随后 在 
其 他 目 昆 虫 中 陆续 鉴定 出 它 的 同 源 基 因 。CSPs 最 
先 被 命名 为 嗅觉 特有 和 蛋白 D (olfactory specific 
protein D, OS-D) (Mckenna et al., 1994) BK A10 
( Pikielny et al., 1994) ,最 后 统一 命名 为 化 学 感受 蛋 
H CSP。CSPs 分 子 量 比 OBPs 小 ,一般 在 10 - 15 kD 
之 间 , 有 4 个 保守 的 半 胱 胺 酸 残 基 位 点 。 在 不 同 目 
之 间 ,CSPs 氨基 酸 序列 相似 度 较 高 。CSPs 基因 在 
昆虫 体内 普遍 表达 ,不 仅 在 触角 、 咏 、 FIRA T 
须 等 嗅觉 器 官 中 表达 (Sun et al., 2016; Zhang et 
al., 2016) ,在 足 ` 翅 和 性 腺 等 非 嗅觉 器 官 中 也 表达 



















































































(Jacquin-Joly et al., 2001; Zhou et al., 2008; Sun et 
al., 2016) 。 由 于 CSPs 基因 表达 的 广泛 性 ,目前 对 
它们 的 功能 还 未 完全 和 弄 清 。 

Ju "E Ze M Riptortus pedestris 属 半 翅 目 
( Hemiptera) 蛛 缘 晴 科 (Alydidae) ,别名 为 白条 蜂 缘 
WAAL Auge ,主要 分 布 在 东南 亚 (Tomokuni et al., 
1993; Kikuhara, 2005) ,在 我 国 河南 河北、 陕西 < 
fal .浙江 \ 江 西 广西 四 川 \ 贵 州 、 云 南 等 省 区 都 有 分 
布 。 该 虫 寄主 植物 主要 包括 鼻 豆 更 豆 、 沫 豆 绿豆 、 
RG. UG. BS MR. BS oe A 
(Schaefer and Panizzi, 2000) ,也 为 害 水 称 、 小 麦 、 高 
梁 \、 玉 米 、 红 慕 、 棉 花 、 甘 芒 、 丝 瓜 等 其 他 科 植 物 。 其 
为 害 严 重 时 造成 豆 类 作物 空 莱 或 瘦 粒 ( Ha et al., 
1998; Son et al., 2000) 。 由 于 该 虫 是 新 发 现 害虫 ， 
研究 较 少 ,再 加 上 农民 对 该 虫 认识 不 足 , 不 能 及 时 防 
治 ,造成 豆 类 作物 严重 减产 ,品质 下 降 , 严 重地 影响 
了 农民 的 经 济 收入 。 但 目前 对 点 蜂 缘 晴 研 究 很 少 ， 
特别 是 分 子 生 物 学 信息 方面 知之 甚 少 。 
本 研究 使 用 Illumina HiSeq'" 4000 高 通 量 测序 
技术 对 点 蜂 缘 晴 成 虫 触 角 进 行 转录 组 测序 , 对 
unigene 进行 生物 学 信息 分 析 ,挖掘 参 与 点 蜂 缘 晴 趾 
觉 传 递 过 程 中 的 重要 基因 信息 ,并 对 气味 结合 蛋白 
和 化 学 感受 蛋白 序列 进行 了 比 对 和 同 源 基 因 进 化 树 
分 析 ,为 今后 利用 基因 驾 标 防治 害虫 提供 更 多 的 参 
考 和 借鉴 。 


1 材料 与 方法 


1.1 供 试 虫 源 

点 蜂 缘 晴 成 虫 采 集 于 河南 省 洛阳 市 李 楼 村 大 豆 
HH ,在 温室 内 用 大 豆 苗 饲养 2 代 以 上 。 挑 取 羽 化 3 d 
未 交配 的 雌雄 成 虫 为 试验 用 虫 ,分别 将 雌雄 成 虫 触 
角 剪 下 并 立即 放 入 液 氮 中 保存 ,雌雄 成 虫 触 角 各 
200 对 用 于 转录 组 测序 。 
1.2 总 RNA 的 提取 与 检测 

首先 使 用 RNAiso"" Plus 试剂 盒 提 取 点 蜂 缘 晴 
雌雄 成 虫 触角 总 RNA ,用 1% 的 琼脂 糖 凝 胶 电泳 检 
测 总 RNA 的 降解 度 和 污染 ; 使 用 Nanodrop 
(IMPLEN, CA, USA) 通 过 0D,。ZOD,。 比 值 ,检测 总 
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RNA 的 纯度 ; 利用 Qubit ( Life Technologies, CA, 
USA) XJ à RNA 浓度 进行 测定 ;使 用 Agilent 2100 
(Agilent Technologies, CA, USA) 检测 总 RNA 的 完 
整 性 。 
1.3 cDNA 文库 构建 与 测序 

将 检测 合格 的 点 蜂 缘 晴 雌 雄 成 虫 触角 总 RNA 
按 1: 1 的 体积 混合 ,然后 取 1.5 pg RNA 备用 。 文 库 
构建 使 用 NEBNext@ Ultra" RNA Library Prep Kit 
(NEB, USA) 试剂 盒 进行 ,所 有 操作 完全 参照 试剂 
盒 的 说 明 。 具 体 方法 是 :首先 用 带 有 Oligo (dT) 的 
磁 珠 语 集 mRNA ,然后 在 NEBNext(5 x ) 的 缓冲 液 中 
将 mRNA 打 断 成 短片 段 。 随 后 使 用 六 碱 基 随 机 引 
物 和 M-MuLV 反 转 录 酶 合成 cDNA 第 1 链 。 再 加 入 
DNA Polymerase I #1] RNase H 合成 cDNA 第 2 链 ,并 
用 AMPure XP 系统 (Beckman Coulter, Beverly, 
USA) Xf cDNA 进行 纯化 。 然 后 修复 未 端 加 A 尾 和 
连接 测序 接头 。 再 用 AMPure XP 系统 筛选 150 ~ 
200 bp 的 片段 后 PCR 扩 增 ,最 后 使 用 AMPure XP A 
统 纯化 PCR 产物 。 在 Agilent Bioanalyzer 2100 系统 
上 对 文库 质量 进行 评估 。 

文库 检测 合格 后 ,用 JUlumina HiSeq™ 4000 测序 
平台 进行 测序 。cDNA 文库 的 构建 和 测序 由 北京 诺 
不 致 源 生物 信息 科技 有 限 公 司 完成 。 
1.4 转录 本 的 拼接 与 组 装 

通过 测序 获得 raw read, 再 经 过 去 接头 、 去 除 
ploy-N 的 读数 和 低 质量 的 读数 ,获得 clean reads。 
同时 计算 Q20, Q30 和 GC 含量 及 重复 序列 水 平 。 
采用 Trinity 对 clean reads 进行 拼接 组 装 获得 转录 本 
序列 , 取 每 条 基因 中 最 长 的 转录 本 作为 Unigene, 进 
行 后 续 分 析 。 
1.5 Unigene 的 功能 注释 

功能 基因 的 注释 使 用 下 列 7 个 数据 库 及 参数 标 
准 : NR Æ A žie Hi JÆ (NCBI non-redundant protein 
sequences, NCBI blast 2.2.28 + , e-value 21e - 5); 






































NT 核酸 数据 库 (NCBI non-redundant nucleotide 
sequences, NCBI blast 2.2.28 + , e-value = 1e-5); 
Pfam 4E FI Zé jk ( Protein family, HMMER 3. 0 
package, e-value 20. 01) ; KOG/COG 直系 同 源 基 
j (clusters of orthologous groups of proteins, NCBI 
blast 2.2.28 + , e-value = le -3 ) ;Swiss-Prot 数据 库 
(A manually annotated and reviewed protein sequence 
database, NCBI blast 2. 2. 28 + , e-value = le — 5); 
KO 京都 基因 与 基因 组 百科 全 书 (KECG Ortholog 
database, e-value = le - 10) ; GO 基因 本 体 论 (Gene 
Ontology, Blast2GO v2.5, e-value 21e - 6), 
1.6 化 学 感受 相关 基因 的 分 析 

利用 在 线 工具 BLAST (https; // blast. nebi. nlm. 
nih. gov/Blast) 对 同 源 基因 进行 搜索 ;使 用 Expasy 
(http: // web. expasy. org/protparam/) 和 SignalP 
(http: // www. cbs. dtu. dk/services/SignalP/ ) 在 线 网 
址 对 氨基 酸 序列 等 电 点 ,分 子 量 和 信号 肽 进行 分 析 ; 
用 DNAMAN 6.0 软件 进行 序列 对 比 ;运用 ClustalX 
2.1(Larkin et al., 2007 ) 软件 对 氨基 酸 序列 进行 比 
对 ,然后 使 用 Seaview v.4. 软件 ,PhyML 进化 树 中 的 
JIT 模式 构建 进化 树 。 使 用 Fig Tree v. 1.3.1 软件 
对 进化 树 进 行 编辑 。 

















2 结果 


2.1 点 蜂 缘 晨 触角 转录 组 的 测序 和 组 装 

对 点 蜂 缘 时 触角 转录 组 进行 lumina 测序 , 28 
果 共 获得 46 972 930 条 raw read ,测序 数据 经 过 滤 后 
获得 45 802 812 条 clean read, 包含 6. 87 Gb 
(GenBank 登录 号 : SRR4429103) ,Q20 ( 表示 质量 值 
三 20 的 碱 基 所 占 百 分 比 ) 为 94. 48% ,GC 含量 为 
40. 0896 (R 1) ,这 些 数据 表明 测序 结果 良好 ,可 信 
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表 1 点 蜂 缘 晴 触角 转录 组 数据 统计 表 


Table 1 Summary of Riptortus pedestris antennal transcriptome data 





原始 总 读数 筛选 后 总 读数 筛选 后 总 核酸 数 (Cb) Q20 Q30 GC 
Total raw reads Total clean reads Total clean nucleotides (96) (96) (96) 
46 972 930 45 802 812 6.87 94.48 86.99 40.08 


Q20, Q30: 分 别 表示 质量 值 三 20 和 30 的 碱 基 所 占 百 分 比 Percentages of bases with the quality value=20 and 30, respectively. 


将 clean read 数据 采用 Trinity 软件 进行 拼接 ， 
获得 115 935 条 转录 本 ,平均 长 度 为 777 bp, N50 为 
1 505 bp。 取 每 条 基因 中 最 长 的 转录 本 作为 unigene， 





共 获 得 92 259 条 unigenes ,平均 长 度 为 618 bp, N50 
为 1013 bp。 随 着 序列 长 度 的 增加 ,unigene 数量 逐 
渐 减 少 。 大 于 500 bp 的 unigenes 有 27 186 条 , 占 整 
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个 unigenes 的 29. 47% 。 
2.2 Unigenes 的 功能 注释 

将 获得 的 unigenes 在 七 大 数据 库 中 进行 功能 注 
释 ,结果 显示 ,在 所 有 数据 库 注释 成 功 的 基因 有 
2 608 条 (2. 8296 ) ,至 少 在 一 个 数据 库 里 注释 成 功 的 
Æ 21 365 条 (23.15% ) ,但 有 70 894 条 (76. 84% ) 基 
因 未 注释 。 其 中 在 NR 数据 库 中 注释 的 基因 最 多 ， 
为 16 247 条 (17.61% ) 。 

将 unigenes 在 NR 数据 库 比 对 发 现 , na e Z 8 
基因 序列 与 内 华 达 十 白蚁 Zootermopsis nevadensis H 
似 度 最 高 ,为 15.22% ,与 先前 报道 的 点 蜂 缘 晴 序 列 
相似 度 为 7. 9% , Ej Wr i AR EP E Acyrthosiphon pisum 
相似 度 为 5.6% , Ej RAD Xx. Tribolium castaneum $H 
似 度 为 5. 296 , MES AR BL Diaphorina citri 相似 度 为 
4.2% , TE NR 数据 库 序列 比 对 e-value 值 为 0 的 
unigenes , 占 总 数 的 15.9% ; e-value 值 为 0 ~ le -45 
的 unigenes , 占 总 数 的 34.9% ;e-value 值 为 le -45 ~ 
le-5 的 unigenes, 占 总 数 的 49.1% 。 将 点 蜂 缘 晴 
unigenes 在 NR 数据 库 序列 比 对 ,相似 度 在 18% ~ 
40% 之 间 的 unigenes 总 数 最 少 ,为 0.2% ;相似 度 在 
60% ~80% 之 间 的 占 unigenes 总 数 最 多 ,为 48.3% 。 
2.3 Unigenes 的 功能 分 类 

经 过 GO 注释 后 , 发 现 23 788 条 
unigenes 注释 为 细胞 组 分 (cellular component ) , 
17 872 条 为 分 子 功能 (molecular function ) FU 38 525 
条 为 生物 学 过 程 (biological process) 。 其 中 基因 富 
集 较 多 的 GO terms 分 别 是 细胞 进程 ( cellular 
484 (binding, 8 435 条 ) .代谢 
过 程 (metabolic process, 7 474 条 ) 、 单 有 机 体 过 程 
6 508 条 )、 催 化 活动 
(catalytic activity, 6 083 条 ) 细胞 整体 (cell, 4 670 
条 ) 和 细胞 部 分 (cell part, 4 670 条 ) ,其 他 GO team 
都 小 于 4 000 条 。 

有 7 137 条 unigenes EA, KO 数据 库 注 释 , 将 它 
们 分 为 五 类 功能 ,可 能 参与 了 32 个 已 知 的 KEGG 代 
谢 通路 , 其 中 基因 富 集 最 多 的 通路 是 信号 传导 
828 条 ), 其 次 是 翻译 
条 ) ,再 其 次 是 碳水 化 合 物 代谢 
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(carbohydrate metabolism, 567 条 ) 和 和 氨基酸 代谢 
(amino acid metabolism, 515 4) ,其 他 代谢 通路 
unigenes 数 小 于 500 4. 

2.4 化 学 感受 相关 基因 鉴定 

所 有 unigenes 经 过 七 大 数据 库 比 对 注释 和 搜索 
后 ,鉴定 出 219 个 化 学 感受 相关 基因 ,其 中 188 AIR 
觉 受 体 6 个 味觉 受 体 、2 个 离子 型 受 体 ,4 个 感觉 神 
经 元 膜 蛋白 、8 个 气味 结合 蛋白 和 11 个 化 学 感受 蛋 
白 基 因 。 

获得 的 8 个 气味 结合 蛋白 中 有 2 个 基因 未 得 到 
全 长 ,其 中 1 个 基因 长 度 小 于 200 bp ,未 在 NCBI 数 
据 库 注册 ,其 他 7 个 基因 依次 被 命名 为 RpedOBPI - 
7,GenBank 登录 号 为 MF627734 - MF627740。11 个 
化 学 感受 蛋白 中 有 2 个 基因 未 得 到 全 长 ,其 中 1 个 
基因 序列 小 于 200 bp ,未 在 NCBI 数据 库 注册 ,其 他 
10 个 基因 依次 命名 为 RpedCSP1 - 10, GenBank 登录 
号 为 MF614836 - MF614845 。 

点 蜂 缘 晴 CSPs 同 源 基因 序列 相似 度 普遍 较 
OBPs 高 ，RpedCSP2 与 黑 肩 绿 育 晴 Cyrtorhinus 
lividipennis 同 源 基因 序列 相似 度 最 高 ,为 81% , 其余 
CSPs 基因 学 列 相似 度 也 在 42% 之 上 , 而 点 蜂 缘 晴 
OBPs 与 同 源 基 因 序 列 相 似 度 最 高 才 达 到 4296 
(RpedOBP7 ) 。 点 蜂 缘 晴 OBPs 蛋白 序列 在 142 ~ 
223 aa 之 间 ,分 子 量 在 15 kD 以 上 ,而 CSPs 蛋白 序 
列 在 125 ~ 133 aa 之 间 ,分 子 量 大 约 14 ~15 kD。 点 
Ze OBPs 和 CSPs 在 成 熟 氮 基 酸 序列 N 端 均 具 
有 信号 肽 ( 表 2) 。 

基因 序列 对 比 发 现 ,点 蜂 缘 晴 OBPs 分 两 种 类 
型 ,一 种 是 带 有 6 个 半 胱 氨 酸 保守 位 点 的 典型 OBPs 
( RpedOBP4 -7) (图 1) , 另 一 种 是 除 6 个 保守 的 半 
胱 氨 酸 位 点 外 ,在 第 6 个 半 胱 氨 酸 后 面 又 多 加 了 3 
TEAR , PKA Plus-C OBPs( RpedOBPI -2) (图 
2) 。 进 一 步 通 过 进化 树 分 析 , 同样 将 点 蜂 缘 晴 分 为 
典型 OBPs 和 Plus-C OBPs 两 个 分 枝 ( 图 3)。 

序列 分 析 发 现 ,点 蜂 缘 晴 CSPs 都 具有 4 个 保守 
的 半 胱 氨 酸 位 点 (图 4)。 去 掉 1 个 序列 较 短 的 
CSP ,剩余 10 个 CSPs 与 半 翅 目 和 鳞 翅 目 其 他 昆虫 
CSPs 同 源 基因 序列 构建 进化 树 ,结果 发 现 ，CSPs 分 
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risks indicate six conserved cysteine residues. 
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RpedOBP1 e MALTNILLICVFTISFYANVYCDDAADECRERPPEEGRER KIPDLIKKKEGVEMHTALHECMESLRKANHPDLFPEGLSGPPAPG...ARPPHPRGPEPPIRVIFÍSI FENN. 113 
RpedOBP2 ISYVSSIQSAMGILSDNTYVLGILIVVAYKVLAEDSDIPKECRNVLSLETEEM@G PIPYGQMSEKELAYMTECTAMPRKGLPSTIDAFEESSS.... ..EESSEEENINIEDEHSI FENK 117 
AhcOBPl] — |t MICSHFIALLSVVALSLSSGEINEECKDIENLKIGQLENEY DFESMIERV..... VRIEEEVETDRFCREERKKIN...... . -STDGKVE . LASEGHISF! VLKRI 97 
EherOBP6 | MSPLPVVLIAFSVLGVVRADSVDCSKPPKGWPRCP. . P: DQPYPSD EMRKHLVSCIRQEVAP..... - - TSAVLTERSIRERR 'VYRS; 86 
LlinOBP29 j| MN..RPLLLLTAVLAVGSGQQEDCKTIAPAGWERRP..F DLPFPLE GMKREFGSCIRGIGNRQ.... . .SSAVETAQAVRDARI[eI VYKG: 85 
AlucOBP3 | MFSSATLVCLFAVALTQGQLDEDPECRPFPHPEGRD..D TIPELIVGEN .MQAMMKQCFEESGMERRPPGPPGSGT.... .. PPTPEEIEAHRSAH FFKA: 99 
LlnOBPi8 [terete tee MCSKYFVMLIGLTVYTSAEVINEECKDRNQSSTEYETFY IDLESSFN.E..... TKSKEKEEAREFCENEFEKANNV.... . .SEDEAEPSPSSVRQU@YVD@ILKK: 97 
AlucOBPI2 ['* e] À n Rh hh hh hh hh hr rnt MRSTGSEBFEEVDARLG.............NKTSWESDMDEYN........ e. eee CEKVKRMKKRHYieL KAKE: 51 
LlinOBP23 J| MYAFTAALSEFLLNIAFAHPGHFDEDPECRQPHRHRHEE.N KV PSLF SNNKDEMHELVHKCFEEAGIKKHGPHHEHHGPPPLEDGPIPPPPPPPESPKNDSKFOSVEQSFLKN. 115 
consensus e e e 
RpedOBP1 LMIADMKPNSEAILGLAENEFVEIDKDWKPISDEBIKHSIASPPÉK.......... VKDDAVSKSGAHGISI[SIVREAYLHSEPAHWIESEAMSKAERALME DMPPPFEPYNKHKKHH...... 223 
RpedOBP2 LLILEGKLNEEVVRRDELEDENS.EPWKEPVAEEBITINSLVKAPS......... AVKEGANHSRSGSYGILIJeVLSEIYENSISPGVWLDSSAMeKEKDRALTIE EYVIR................. 215 
AlucOBP1 MGQGDERFIRERLDDEFLRGYPE..EVKQAGKRIBEDHBLSENES............. RRYSASGINGLMMeSLPEELVMNeEEANIWSSHESeP EAIK SYRVMIEQE............. 194 
EherOBP6 FINKDDNVLGQREAIERGQLQSVAG.KSWGKAITASLDHMSFREAEELEDSDSASSSVEEESSeSSIPERLTF[eLSRNLELNSESEDVWENTICEIeCIVÉNRME QLLPPPPIRFIRPGPRPPIVEQ 211 
LlinOBP29 FMEEHN. LNKDQLLEQLKKGVAGKKDWEXKPMEDAVR HETIIRKREIP........ QEGMSCDSAHEFTHeVMRGLELS SEWNNNDHeNLVHRNRMQAENIPPPPPPPEQGERGQGEEQEQ 202 
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KWEMEGIHR..DFEEVGKQBMERBYDRTYS............. KRHeASRVMGLLWeYSEELVM| KYWDQSENST. YMKHÉSINPWRSED.............. 160 
NSKEDQI.....WKDDIEEYNSNPQAICERHeVWRGVEMHSSEEHCNIGRHeKEKLRSRIS SKDSIAKETSV........... 194 
LERKAKIEE......... NEPSHSKAGSKRVLHSLAREF FMN@ SASDWTESE LAARDRVS HSLPEMBB.............. 216 
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2 点 蜂 缘 晴 OBPs( RpedOBP1 与 RpedOBP2) 与 其 他 昆虫 Plus-C OBPs 的 序列 比 对 


Fig. 2 Alignment of Plus-C OBPs of Riptortus pedestris ( RpedOBP1 and RpedOBP2) and other insect species 





其 他 昆虫 Plus-C 气味 结合 














"DE GenBank 登录 号 Source of plus-C OBPs of other insects and their GenBank accession numbers; AlucOBP1 , 


AlucOBP3, ，AlucOBP12 : 2 Eit Apolygus lucorum, ADD84665. 1, AEP95760. 1, AFJ54053. 1; EherOBP6; 美洲 晴 Euschistus heros, ATU64823. 1; 


LinOBP18, LlinOBP23 , Lli 

















nOBP29 , 美国 牧草 盲 晴 Lygus lineolaris, AHF71046. 1, AHF71053. 1, AHF71060. 1. 星 号 表示 保守 的 半 胱 氨 酸 残 基 。 


Asterisks indicate the conserved cysteine residues. 
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图 3 点 蜂 缘 晴 与 其 他 昆虫 气味 结合 蛋白 的 进化 树 





Fig. 3 Phylogenetic relationship of odorant binding proteins ( OBPs) of Riptortus pedestris and other insects 
气味 结合 蛋白 来 源 Source of OBPs: ;u Më ZR B Riptortus pedestris ( RpedOBP) , 4% Ej lt Apolygus lucorum ( AlucOBP) , Ë ła Ei f£. Adelphocoris 


lineolatus (AlinOBP) , rp 5E 


KAL Laodelphax striatella ( 
ZÆ Bombyx mori ( BmorO 








E EPI Adelphocoris suturalis ( AsutOBP) , 3 Jf Yt Drosicha Corpulenta ( DcorOBP) ,， 烟 粉 乱 Bemisia tabaci ( BtabOBP) , Jk 
LstrOBP) , FT Kik Sogatella furcifera (SfurOBP) , 棉 蚜 Aphis gossypii ( AgosOBP) , K ki lf Aphis glycines ( AglyOBP) , 


BP) , 棉铃 虫 Helicoverpa armigera ( HarmOBP). 进化 树 中 序列 名 为 GenBank 登录 号 + 基因 名 ; 蓝 色 区 域 为 plus-C 气味 




















结合 蛋白 。The names of sequences are GenBank accession no. plus gene name in the phylogenetic tree. The region of blue color is plus-C OBPs. 
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RpedCSP1 ... *MKEIVLSVLLMACIAVËBVQA TETEE TIKYBNIL LLNEMEHeVME! EDGKALBEA (QIDesmel SGTAKVIKELVERKKAME DER SA Meee He LYXKKYNEEAKAKGIKLIL... 127 
RpedCSP2 ++ +-MRMSGVIVLALCGLSLAAE..... TSKYBNID' ILTQMINSLME NEGREIREKTLEDALSSQeAHSS: RSQTERVLRHLSKNRERDWARERTHE EYSKRYEGRFIQEPSS...... 125 
RpedCSP3 +. MNTVAALGVLLVAALVAADEG...KFTIKYBNVNVBE LLENMLHeLLD PDGGEIRESIBEAEKDHeAHeS EGIKKVIPFLVKEHBDYFLEEEK! IWRKTYEPEAKKLGIELPPKGE 133 
RpedCSP5 MLSALLGALLLASAAVSA EMSQDEREVÉERIFNDAD ki ILDMLR®F FN] TLGKEIBGKISEVFSDVGREIL: JRVWRHAMCIFIPKREKDWERILS: SYWPGIRAELEG.PAP...... 133 
RpedCSP6 MGELLLPLALFLAPQPSLSAVTCADIERSVEMRLGVIDVE| IITHAI LR PPEARDFRRT RHIÍSENeTDReERNALKLIFTFVKENYEBDEWG! IK: EAQERLNAFIAS.......... 130 
RpedCSP7 + MKELMIVLMLAGL, ATT... TIIKYBNIN LYREMEELEG. PPGKELBEL ETIjesHes IAGSEKVLRELLEKKBDDYAEDEK IYKKKYGEEFEKQGER...... 126 
RpedCSP8 +. MKLVLALGLVVAAVSRLPCAQQG.SNTTKYBSVN LYKRNMENeTLAN PDAAELRXVLBDABET IN IKGTERVIKHMLDRRBADYDVÉER [EFRKKYKDEAGKBGIRL..... 130 
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图 4 点 蜂 缘 晴 9 个 化 学 感受 蛋白 的 序列 比 对 
Fig. 4 Sequence alignment of nine chemosensory proteins ( CSPs) of Riptortus pedestris 
星 号 表示 4 个 保守 的 半 胱 氨 酸 残 基 。Asterisks indicate four conserved cysteine residues. 


为 两 大 术 ,点 蜂 缘 晴 主 要 集中 在 其 中 一 个 分 校 上 , 相 ”应 的 同 源 性 较 高 的 分 枝 中 , 而 鳞 翅 目 CSPs 具有 两 个 
当 分 散 , 但 每 一 个 点 蜂 缘 晴 CSP 序列 都 插 在 与 其 对 特有 的 分 区 (图 5)。 











图 5 点 蜂 缘 晴 与 其 他 昆虫 化 学 感受 蛋白 的 进化 树 


Fig. 5 Phylogenetic relationship of chemosensory proteins ( CSPs) of Riptortus pedestris and other insects 


























化 学 感受 蛋白 来 源 Source of CSPs: 点 蜂 缘 晴 Riptortus pedestris ( RpedCSP) , 5 Ej li Apolygus lucorum ( AlucCSP) , Ë 8 Bi Wf Adelphocoris lineolatus 
(AlinCSP) ,中 黑 盲 晴 Adelphocoris suturalis ( AsutCSP) , X; S£ Ej M Lygus Hesperus ( LhesCSP) ， 刺 晴 象 Triatoma brasiliensis ( TbraCSP) ， 烟 粉 乔 
Bemisia tabaci ( BtabCSP) , JK ifi Laodelphax striatella (LstrCSP) , 褐飞虱 Nilaparvata lugens ( NlugCSP) , H Kl Sogatella furcifera ( SfurCSP) , 
AB! Aphis gossypii ( AgosCSP) , Tk 3& 28 yj Wy Phenacoccus solenopsis ( PsolCSP ), Z& Y& Bombyx mori (BmorCSP) ， 棉 铃 虫 Helicoverpa armigera 
(HarmCSP). 进化 树 中 序列 名 为 GenBank 登录 号 + 基因 名 。The names of sequences in the phylogenetic tree are GenBank accession no. plus gene 


name. 
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3 讨论 


随 着 新 一 代 高 通 量 测序 技术 的 发 展 ,通过 转录 
组 测序 逐渐 成 为 挖掘 非 模式 生物 功能 基因 的 有 效 捷 
径 ( 张 棋 迄 和 袁 明 龙 , 2013) 。 本 研究 利用 Humina 
HiSeq'™ 4000 高 通 量 测序 技术 , AT A E ee MEHE R 
虫 触角 转录 组 进行 测序 ,获得 92 259 条 unigenes , 平 
均 长 度 为 618 bp, N50 为 1 013 bp ,这 与 大 多 数 昆虫 
触角 转录 组 获得 的 结果 一 致 (An et al., 2016; Xiao 
et al.，2016; Zhang et al.，2016)。 对 所 有 的 
unigenes 进行 功能 注释 和 同 源 搜索 发 现 ,有 21 365 
(23.15% ) 条 unigenes 注释 成 功 , 还 有 70 894 
(76. 8496 ) 条 unigenes 未 注释 到 ,这 可 能 与 unigenes 
的 片段 长 度 有 关 , 因 为 有 46. 5396 的 unigenes 的 长 
度 在 300 bp 以 下 。 也 有 可 能 部 分 unigenes 为 非 编 
码 基 因 或 注释 基因 还 不 够 丰富 。 在 NR 蛋白 数据 库 
中 注释 到 unigenes 数 最 多 , 为 16 247 条 , 占 总 
unigenes 基因 数 的 17. 6196 ,这 与 大 多 数 研 究 结果 相 
同 ( 金 永 玲 , 2015; 孟 翔 等 , 2016) ,说 明 NR 数据 库 
储存 基因 数量 大 、 种 类 多 。 其 中 点 蜂 缘 晴 触 角 转 录 
组 序列 与 内 华 达 古 白蚁 基因 序列 相似 度 最 高 ,为 
15.22% ,与 赤 拟 谷 盗 基 因 序 列 相 似 度 为 5.2% ,而 
与 点 蜂 缘 晴 同 一 目的 殖 豆 长 管 蚜 和 柑橘 木 乔 基因 序 
列 相 似 度 仅 为 5.6% All 4. 2% ,这 可 能 是 由 于 半 翅 目 基 
因数 据 在 NR 数据 库 中 还 不 够 丰富 (An et al., 2016 ) 。 

本 研究 发 现 的 23 788 条 unigenes 经 GO 注释 分 
为 三 大 功能 , 其 中 在 分 子 功能 中 , 结合 (pinding， 
8 435) 和 催化 活动 (catalytic activity, 6 083) 所 占 基 
因数 最 多 , 这些 基因 的 表达 模式 符合 触角 的 功能 。 
TE KO 数据 库 中 , 共 注 释 到 7 137 条 unigenes ,并 对 
这 些 基 因 进 行 了 KEGG 代谢 通路 分 析 , 将 它们 分 为 
五 类 功能 ,主要 参与 了 32 个 KEGG 代谢 通路 ,其 中 
信和 号 传导 (signal transduction, 828) 是 最 大 的 代谢 通 
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白 。 在 其 他 半 翅 目 昆虫 触角 转录 组 中 ,也 鉴定 出 不 
lr] SS AY Ju X 5e BJ uw ED]. Uk Ë d B M 
Adelphocoris lineolatus 触角 转录 组 中 ,鉴定 出 80 NIR 
觉 受 体 12 个 离子 型 受 体 ,4 个 味觉 受 体 .14 个 气味 
结合 蛋白 和 4 个 感觉 神经 元 膜 蛋白 (Gu et al., 
2011; Xiao et al., 2016) ;在 绿 育 晴 Apolygus lucorum 
触角 转录 组 中 ,鉴定 出 110 个 嗅觉 受 体 (An et al., 
2016) 38 个 气味 结合 蛋白 (Yuan et al., 2015) ;在 
小 长 晴 Nysius ericae 触角 转录 组 中 ,鉴定 出 83 个 串 
觉 受 体 12 个 离子 型 受 体 7 个 味觉 受 体 28 个 气味 
结合 蛋白 16 个 化 学 感受 蛋白 2 个 感觉 神经 元 膜 蛋 
白 (Zhang et al., 2016) 。 与 半 翅 目 其 他 昆虫 触角 转 
录 组 中 鉴定 出 的 嗅觉 相关 基因 数量 相 比 , 除 离子 型 
受 体 和 和 气味 结合 蛋白 基因 数量 较 少 外 ,其 他 基因 都 
在 合理 的 范围 之 内 。 

点 蜂 缘 晴 OBPs 基因 分 两 种 类 型 , RpedOBP4 -7 
都 为 典型 OBPs, 序 列 完全 符合 C1-X,sas-C2-X3-C3- 
X, -C4-X. ,-C5-X,-C6 结构 模式 (Sun et al., 
2016) ;RpedOBP1 -2 为 Plus-C OBPs 基因 ,结构 模 
式 基 本 上 符合 Cl-X4,4-C2-X,-C3-X,4,-C4-X, ;,-C5- 
X,-C6-X,-C7-X,,-C8-X,-C9, XTR A T ^E 38 A AA SE 
xH HRS 158 个 OBPs 同 源 基因 进行 进化 树 比较 , 同 
样 将 OBPs 划分 为 典型 OBPs 和 Plus-C OBPs 两 个 分 
校 ,但 目前 关于 典型 OBPs 和 Plus-C OBPs 之 间 的 功 
能 差异 还 不 清楚 。 点 蜂 缘 晴 CSPs 氨基 酸 序列 都 具 
有 4 个 保守 的 半 胱 氮 酸 位 点 ,并 且 符合 CSPs 基因 的 
结构 模式 CI-X,-C2-X,,-C3-X,-C4 (Sun et al., 
2016) 。 与 其 他 昆虫 进化 树 分 析 发 现 , 点 蜂 缘 晴 化 
学 感受 蛋白 分 布 相当 分 散 , 说 明 CSPs 基因 分 化 较 
大 ,但 是 每 一 个 化 学 感受 蛋白 序列 都 能 插 在 与 其 对 
应 的 同 源 性 较 高 的 分 枝 中 。 不 同 目 昆虫 之 间 化 学 感 
受 蛋 白 有 自己 特有 的 分 区 ,这 可 能 是 长 期 对 环境 适 
应 的 结果 。 因 此 ,通过 对 点 蜂 缘 晴 触 角 转 录 组 数据 
的 分 析 ,挖掘 出 更 多 与 嗅觉 相关 的 基因 ,了 解 这 些 基 






























































路 ,这 与 触角 是 气味 结合 和 信和 号 传导 的 主要 器 官 密 
切 相 关 。 另 外 ,我 们 也 鉴定 到 与 外 源 性 物质 降解 和 
代谢 ( xenobiotics biodegradation and metabolism, 
147) 有 关 的 基因 ,这 些 基 因 可 能 牵扯 到 触角 嗅觉 信 
号 传递 过 程 中 对 气味 的 降解 功能 ( Leal, 2013) 。 

触角 是 昆虫 接受 外 界 信 息 、 传 递 信 号 ,使 昆虫 做 
出 相应 反应 的 主要 器 官 。 我 们 通过 Blast 和 同 源 搜 
素 , 鉴 定 出 219 个 与 嗅觉 相关 的 基因 ,包括 188 AIR 
觉 受 体 .6 个 味觉 受 体 、2 个 离子 型 受 体 .4 个 感觉 神 
经 元 膜 蛋白 、8% 个 气味 结合 蛋白 和 11 个 化 学 感受 蛋 












































因 的 特性 ,为 今后 利用 嗅觉 靶 标 防治 点 蜂 缘 晴 提 供 
更 多 理论 参考 。 
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